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Проектування інтелектуальних агентів 
прийняття рішень в просторі ознак 
із використанням онтологічного підходу 


У статті розглядається проблема побудови метрики для знаходження релевантних прецедентів інтелектуальним 
агентом, який функціонує в просторі ознак. Пропонується зважувати ознаки коефіцієнтами їх важливості, які 
зберігаються в онтології предметної області. Розглянуто способи визначення цих коефіцієнтів. 


Вступ 


Сучасний рівень розвитку інтелектуальних систем прийняття рішень відбувається 
у двох напрямках розроблення інтелектуальних агентів (ТА) (11: 

- інтелектуальні агенти планування своєї діяльності; 

- інтелектуальні агенти, засновані на прецедентах. 

Перший напрямок використовує відомий підхід прийняття рішень як де дуктив- 
ний процес з використанням логічного виведення, заснованого на правилах. Задача, 
яку розв'язує інтелектуальний агент, полягає в досягненні стану мети. Часто інтелек- 
туальність агента полягає в тому, щоб цей стан досягнути з якомога найменшими 
затратами своїх ресурсів. Розв'язок такої задачі зводиться до пошуку шляху у просторі 
станів. Для оцінки релевантності станів, що лежать на шляху, використовуються метрики, 
які задаються у вигляді евристичних функцій. Такі евристичні функції, а отже як наслідок 
і метрика, можуть базуватися на онтології предметної області (ПО), в межах якої 
функціонує ІА. 

З часом було усвідомлено, що дедуктивна модель моделює один з найбільш 
рідкісних підходів, який використовує ІА під час вирішення проблеми. Ідея виведення 
за правилами є привабливою, тому що вона грунтується на добре формалізованих 
поняттях, для яких існують наукові методи, що довели свою застосовність і які доз- 
воляють отримати рішення, що не вимагають доведень. Однак навколишній світ складний. 
Існує багато слабо формалізованих завдань, для яких, можливо, будуть знайдені рішення. 
Крім того, існує ряд завдань, для яких ніколи не буде знайдено формальне рішення 
(судочинство, медицина). Актуальність проблеми обумовлена і чисельністю таких завдань, 
і практичною потребою знайти хоча б одне яке-небудь відповідне рішення там, де 
через відсутність строгого формалізованого методу не можна знайти всі або найом- 
тимальніші рішення. 

Насправді, замість того, щоб вирішувати кожну задачу, виходячи з первинних 
принципів, ІА часто аналізує ситуацію в цілому і згадує, які рішення ухвалювалися 
раніше в подібних ситуаціях. Потім він або безпосередньо використовує ці рішення, 
або, за необхідністю, адаптує їх до обставин, що змінилися для конкретної проблеми. 
Моделювання такого підходу до вирішення проблем, заснованого на досвіді минулих 
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ситуацій, привело до появи технології логічного виведення, заснованого на прецедентах 
(англійською -- Саз5е-Вазед Веазопіпє, або СВБ), 1 надалі - до створення програмних 
продуктів, що реалізовують цю технологію. 

У ряді ситуацій метод виведення за прецедентами має серйозні переваги в порів- 
нянні з виведенням, що грунтується на правилах, і особливо ефективний, коли: 

- основним джерелом знань про завдання є досвід, а не теорія; 

- рішення не унікальні для конкретної ситуації ії можуть бути використані в 
інших випадках; 

- метою є не гарантоване вірне рішення, а краще з можливих. 

Таким чином, виведення, засноване на прецедентах, є методом побудови інте- 
лектуальних систем, які приймають рішення щодо даної проблеми або ситуації за 
наслідками пошуку аналогій, що зберігаються в базі прецедентів. 

Як бачимо, для обох класів інтелектуальних систем прийняття рішень необхідна 
метрика. У першому випадку - для оцінювання релевантності станів, у другому випадку -- 
для оцінювання релевантності прецедентів. Від способу визначення цієї метрики напряму 
залежить ефективність роботи ТА. На наш погляд, такий спосіб повинен базуватись 
на онтологіях ПО, в межах яких функціонує ІА. 

Метою цієї роботи є побудова метрики на основі онтологій ПО для ефективного 
функціонування ІА. 


Класифікація задач 


Проаналізувавши клас задач, які розв'язуються інтелектуальною системою, можна 
зробити висновок, що всі задачі можна поділити на два величезні підкласи, виходячи 
із самої постановки задачі. Так, існує клас задач, для яких суттєве значення понять 
(властивостей). Сюди відносяться задачі діагностики захворювань, кваліфікації явищ 
на основі збору даних тощо. Такі задачі назвемо ознаковими. Для іншого класу задач 
не є суттєвим значення понять, а скоріше їх семантика або частотність. Зокрема, сюди 
можна віднести кластеризацію інформаційних ресурсів, класифікацію текстів згідно 
з УДК, пошукові системи. Такий клас задач назвемо семантичними задачами. 

В результаті отримаємо поділ інтелектуальних систем за двома вимірами, так 
як це зображено на рис. І. 


Рисунок І - Класифікація інтелектуальних систем прийняття рішень 


Для ефективного функціонування ІА необхідно побудувати метрику, на основі якої 
визначати релевантність станів чи прецедентів. На наш погляд, побудова такої метрики 
напряму залежить від класу задач: семантичні вони чи ознакові. Онтологія першого 
класу більш спрямована на врахування семантики ПО. Онтологія другого класу - 
віднесення об'єктів до класів. Формально онтологію задамо як п'ятірку |2| 


Он(С,ВЕМ,І), 


де Й/ - важливість понять С, І, - важливість відношень К, К - інтерпретація цих 
понять та відношень. 
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Семантичні задачі (використовуються нагромаджувальні методи задання ваг 
термінів та відношень). До класу цих задач належать задачі, для яких є несуттєвим зна- 
чення ознак об'єктів, що належать до класів онтології. Суть цих задач полягає у визначенні 
семантики інформації: 

а) класифікація за УДК; 

6) інформаційно-пошукові системи за контекстом; 

в) кластеризація інформації (структуризація масиву інформації); 

г) автоматичне реферування; 

д) переклад з мови на мову. 

Для семантичних задач метрика визначається як відстань в концептуальному графі 
між п-ою кількістю центрів ваг. Детально цей спосіб нами розглянуто у роботах |3), 41. 

Тому у цій роботі детальніше розглянемо проблему побудови ефективних метрик 
для ознакових задач, а саме для пошуку релевантних прецедентів. Очевидно, що виз- 
начена для таких задач метрика успішно може використовуватися у інтелектуальних сис- 
темах планування діяльності. 

Ознакові задачі (використовуються ймовірні методи, експертні методи та методи 
на основі інтелектуального аналізу даних). До класу цих задач належать задачі для 
яких є суттєвим значення ознак об'єктів, що належать до класів онтології: 

а) задачі медицини (діагностика захворювань); 

6) прогнозування явищ; 

в) прийняття рішень в активних середовищах. 


Побудова метрики для ознакових задач 


Нехай множина прецедентів Ру - (Риш, Рі»,...Ріх) описується характеристиками 
(властивостями) Х - Їх/Х2,...Хм). 0; - домен властивості х;. Для відображення власти- 
востей ми використовуємо нове позначення Х, а не С, оскільки, як правило, ці значення 
є властивостями об'єктів, які належать класу С. Хоча можливі випадки, що окремі влас- 
тивості тотожні класу. Це залежить від того, як був проведений онтологічний інжиніринг. 

Релевантним Рі; є прецедент, для якого відстань до поточної ситуації є наймен- 
шою, тобто 

Рец - аге тій й 
І 

Тоді прецеденти розрізняються між собою в залежності від значень, які набу- 
вають ці властивості. Очевидно, що для розпізнавання прецеденту не потрібно значення 
деяке дерево рішень, то окрема гілка від кореня дерева до листка описує окремий 
прецедент, а значення властивостей, які знаходяться на цій гілці достатньо для опису 
цього прецеденту. Тобто 


Рг є» Х, 1 заз, Днь і де 2, ЄР,. 


З іншого боку, властивість, яка знаходиться на вищому рівні дерева рішень, 
повинна мати більшу вагу в адаптивній онтології. Оскільки для різних прецедентів 
властивості можуть знаходитися на різних рівнях дерева рішень, то коефіцієнти важ- 
ливості понять насправді представляють собою вектори виміром кількості прецедентів, 
тобто Й «(ТИМ)» де Й" коефіцієнти важливості понять онтології, яка описує 
прецедент Рг». 

Тоді відстань між прецедентом Рі; та поточною ситуацією 5: 


зе -9(2узгі), (1) 
ТА1 
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де 2, значення властивості х, прецедента РУ; 2 значення властивості х, поточної ситу- 
/ 
ації 5, м», коефіцієнт важливості властивості х, прецедента Руе.. 
Розглянемо функцію Ф(х, у). Очевидно, що х - може бути діапазоном, тобто нечіт- 


кою множиною, де 0 - універсальна множина х с 0; числовим значенням або нечис- 
ловим значенням. В залежності від цього ф(х, у) визначається по-своєму: 


1- щ, (у), х- нечітка множина, 
ф(х, у) - Ах-у 
1- ш(», у), х, у - нечислові значення. 


, х, у - числові значення, (2) 


де ш, (у) - коефіцієнт впевненості того, що у належить нечіткій множині х, 4 - числова 
величина, яка залежить від ПО, щоб 2-х - у| є |0,1|, ш(х, у) є 0,1) - нечітка величина 
подібності значень х та у. Наприклад /(х, у)-1, якщо хз у, щ(х, у) - 0,9, якщо ху, 


щ(х, у) - 0, якщо хжу. 

Розглянемо методи задання початкових коефіцієнтів важливості понять та зв'язків 
та їх модифікацію в процесі функціонування інтелектуального агента, який викорис- 
товує цю онтологію. 

Методи задання початкових ваг (коефіцієнтів важливості) понять та зв'язків: 

1.За рахунок експертних оцінок. 

2. Присвоєння випадковим чином. 

3.За рахунок аналізу (статистичного, інтелектуального) інформаційних джерел, 
які описують ПО, в якій функціонує ІА. 

Окрім того, ці ваги можуть мати обмеження на величину, наприклад їх значен- 
ня знаходяться у проміжку (0,1) (ймовірнісні методи) або без обмежень на величину 
(нагромаджувальні методи). 

Розглянемо визначення ваг термінів онтології на основі інтелектуального аналізу 
даних, а саме на основі побудови дерева рішень (ДР). Як відомо, ознакові задачі дозво- 
ляють для пошуку релевантних прецедентів будувати ДР. Однак ДР не є панацеєю, 
оскільки згадувані ознаки, що лежать на відповідній гілці, що задає прецедент, не 
гарантують врахування повної множини ознак, які необхідно врахувати для знаходь- 
ження релевантного прецедента. Тому комбінований метод (побудова ДР - розвинення 
ДР на основі онтології) виглядає перспективним. Нами пропонується використовувати 
ДР для визначення ваг базових термінів, які задають деякий прецедент, а потім на 
основі онтології ПО розвинути отримані ваги на всю онтологію для відповідного 
прецедента. Тоді для пошуку релевантного прецедента використовувати значення 
тих п концептів, які для відповідного прецедента мають найбільші ваги. 

Відомо, що отримати правила пошуку релевантних прецедентів можна на основі 
побудови дерева рішень. 

Розглянемо гілку дерева. Вершини (ознаки) цієї гілки знаходяться на К рівнях. 
Очевидно, що чим вищий рівень, тим значуща ознака, яка на цьому рівні знаходиться. 
Ця евристична думка має бути відображена в значеннях ваг цих ознак. Крім того, про- 
понується ці ваги пронормувати, тобто щоб їх сума для кожного прецедента (гілки) 
була рівна І. 

Розглянемо два способи визначення ваг базових ознак, які задовольняють вище- 
описані два припущення. 

1-й спосіб. Арифметичні ваги. Визначаються як відношення різниці (/-1) рівня 
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дерева та рівня, на якому знаходиться ознака, до суми всіх рівнів гілки, тобто базу- 
ються на сумі арифметичної прогресії: 
аЖенфоюо ФІЗ 


У (ач кую 


2 


2-й спосіб. Геометричні ваги. Базуються на сумі геометричної прогресії: 


ско 
ум з : 
Жро 
Так, для гілки рівня К - 4 отримаємо: 
Рівень знаходження 
ознаки в ДР Арифметична вага Геометрична вага 

, 8 
1-й УЛ с вні М аневснот 

5 15 

2-й у, і ми з 
"ИЙ и нний че 

210 "В 

3-й 77 1 77 г 
-И шео-- сенс 

йо 7 15 

з 1 " 1 
-И у/ шин ше- 

"10 1 15 


4 
Легко бачити, що Ум - 1 для обох способів визначення ваг. 
ізі 
Отримані на основі ДР ваги назвемо вагами базових ознак прецедента і поз- 
начимо таку множину ваг И//,. Розвинемо їх на всю онтологію ПО, використовуючи 


таксономію понять онтології та інтерпретацію термінів, тобто: 
11 ВА 


Зауважимо, що наразі ми розглядаємо лише один конкретний прецедент. Насправді 
вага терміна є вектор розмірності кількості прецедентів, про що зазначалось вище. 

Розмноження ваг на всю онтологію залежить від визначення (аксіоматизації) 
класів, їх ієрархії (вертикальний зв'язок) та горизонтальних зв'язків. 

Тепер впорядкуємо множину ознак відповідно до їх ваг, тобто у 2 М, 2 У, 2.... 
Для визначення відстані між прецедентом та поточною ситуацією за допомогою фор- 
мули (1) візьмемо перші М ознак. 


Приклад функціонування інтелектуального агента 


Розглянемо приклад функціонування ТА в області медицини, а саме захворювань 
опорно-рухового апарата. За основу візьмемо результати досліджень, що одержали у 
Львівському Національному медичному університеті ім. Данила Галицького Е.Х. Заремба 
й О.О. Зімба. З деякими з них можна ознайомитися в |5|. Прецедентами є можливі зах- 
ворювання. Для прикладу розглянемо три хвороби: Рі - (Ревматизм, Артрит, Подагра). 

Провівши онтологічний інжиніринг ПО, ми одержали множину властивостей, 
які необхібно дослідити та їх важливість в залежності від прецеденту. Наведемо 
деякі з них: Х - (Ступінь недиференційованої дисплазії сполучної тканини, Концентрація 
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ендотеліну- І у плазмі крові, Температура, Біль у суглобі). Розглянемо детальніше ці ознаки. 
Домен першої є нечислові значення, другої 1 третьої - відрізки, четвертої - бінарне 
значення. Так Дс у д с т |Слабке, середнє, сильне), Дк г я к'- ПО53,91, Штемлература " (36421, 
Джі у суглобі" | Так(1), Немає(0)). Значення цих ознак для ревматизму: Температураревматизм 
-- 1(36)), (370,6), (3811), (39|1), (40(0,7)) - нечітка множина, Біль у суглобіревматизм - «Так(1)». 

Важливість цих властивостей (коефіцієнти Й/) ми одержали методами статис- 
тичного аналізу (було досліджено 110 пацієнтів). Так для захворювання на ревматизм 
важливими симптомами є: наявність лади (и/ - 0,7), астенічна статура (у» - 0,65), тонка 
шкіра (му - 0,45), сколіоз (у - 0,35). Перший симптом являє собою бінарну величину, 
що приймає значення з множини |Так(1),Немає(0)), дві наступні - нечіткі величини, 
що приймають значення з відрізка |0;1| (зрозуміло, що 0 - відсутність симптому, І - 
повна впевненість у його наявності) і четвертий симптом теж нечітка змінна, тільки 
й носій - відрізок |0;3|. Для ревматизму приймаємо такі значення симптомів: 2лади І, 

-н » тк 1 з» сколіоз Є П, У З; 

Нехай при обстеженні пацієнта У ми одержали такі значення властивостей улгади, 
Уас» Утк» Усколіоз» ТОді відстань до прецедента, що цей пацієнт хворий ревматизмом, 
виміряється як: 

каві З 0, 7. П -Улади, ЯЕ 0, 65. ПІ Маг Р 0, 45. ПІ -Упк б 0, 35. ПУ ді, є з скаліові| 

Аналогічним чином можна виміряти відстань до інших захворювань (артрит, 

подагра). Пацієнт хворий тим захворюванням, відстань до якого є найменшою. 


Висновки 


У роботі розглянуто модель функціонування ІА для задач, для яких важливі 
значення ознак. Побудована метрика для пошуку релевантних прецедентів, яка базу- 
ється на онтології ПО. Це надало можливість підвищити ефективність функціонування 
таких ІА. Розглянуто способи визначення ваг понять онтології. 
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У.Р. Іугууп, В.К. Фагеуусн, Р.С. Розуп, М.У. 5ПКипак 

Ріаппіпо ої ПаеПесіпа! Десізіоп-такКіпо Агсепіз іп ап Ангіриіез 5расе ууїкв "пе Ю5е 

ої Опіоіобіса! Арргоасі 

Іл їбе рарег Фе ргобіет ої паеїгісз соп5ігисйоп Бог 5еагсріпе ої геЇєуапі ргеседепіз Бу ап іпіеЙесіша! аєепі 
уубісі орегаїе і Ше айгібиіез 5расе 15 сопзідегед. ТПе айтібие5 15 ргорозед іо ууеїєп Бу Бе соеййісіепів ої 
Феїг ітрогіапсе, місії 15 зїогаєє іп дотаїп опіоїогу. ТРе арргоасре5 ої деїегтіпайоп ої Пезе соесіепів 
аге соп5ідегед. 
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